Développement de méthodes de classification basées sur l'analyse de concepts formels sous la plateforme WEKA
نویسندگان
چکیده
Le travail présenté dans ce papier se place dans le contexte d’intégration de nouvelles méthodes de classification basée sur l’Analyse de Concepts Formels sous WEKA et propose une nouvelle famille nommée “Lattice” qui contient six méthodes basées toutes sur la construction d’un treillis de concepts. Le but de la classification est d’organiser un ensemble d’objets en classes homogènes. Les objets sont représentés par des enregistrements qui sont constitués d’un ensemble de champs (attributs) prenant leurs valeurs dans un domaine (contexte). Une classe désigne un ensemble défini de données et d’objets semblables. Ces données et objets, éléments d’une classe, sont des instances. Le treillis de concepts offre un cadre intéressant en classification. Deux phases sont indispensables dans un processus de classification, à savoir la phase d’apprentissage et la phase de classification. La phase d’apprentissage consiste à organiser l’information extraite d’un ensemble d’objets sous forme d’un treillis. La phase de classification consiste à déterminer la classe de nouveaux objets plus ou moins détériorés par la navigation dans le treillis.
منابع مشابه
Générer des règles de classification par dopage de concepts formels
Résumé. La classification supervisée est une tâche de fouille de données (Data Mining), qui consiste à construire un classifieur à partir d’un ensemble d’exemples étiquetés par des classes (phase d’apprentissage) et ensuite prédire les classes des nouveaux exemples avec ce classifieur (phase de classification). En classification supervisée, plusieurs approches ont été proposées dont l’approche ...
متن کاملGénéralisation des opérateurs de dérivation de Galois en recherche d'information basée sur l'analyse formelle de concepts
RÉSUMÉ. La recherche d’information basée sur l’analyse formelle de concepts repose généralement sur l’utilisation de la structure de treillis des concepts formels. Les noeuds de ce treillis (i.e. les concepts formels) peuvent être interprétés comme des paires 〈réponse,requête〉. A ce jour, la quasi-majorité des travaux existant en ce sens utilisent l’opérateur de dérivation de Galois classique (...
متن کاملLa combinaison d'UML avec la méthode formelle CSP-OZ pour le développement d'applications bases des données
Les méthodes utilisées pour la spécification et le développement d’applications de bases de données sont basées soit sur les notations graphiques (appelées méthodes semi-formelles) soit sur des notations mathématiques (appelées méthodes formelles). Les méthodes semi-formelles (E-R, UML, OMT,...) (Jacobson et al., 2005) permettent une représentation intuitive et synthétique du système à étudier....
متن کاملTraMineR: une librairie R pour l'analyse de données séquentielles
TraMineR est une librairie pour l'environnement statistique R destinée à la fouille, la description et la visualisation de séquences d'états ou d'événements, et plus généralement de données séquentielles discrètes. La librairie est librement disponible sur le CRAN http://cran.r-project.org. Elle est principalement conçue pour l'analyse de données biographiques longitu-dinales dans le domaine de...
متن کاملEvaluation de la Performance de la Classification d'un Système Question/Réponse
RÉSUMÉ. La plupart des systèmes question/réponse se basent sur trois axes principaux : classification et analyse de la question, recherche de document pertinents et extraction de la réponse. La performance à chaque étape affecte le résultat final. La classification de question apparaît comme une tâche importante car elle infère le type de réponse attendu. Dans cet article, nous présentons des m...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
دوره شماره
صفحات -
تاریخ انتشار 2010